서론
1.
연구의 필요성 및 목적
최근 문화체육관광부와 한국관광공사는 2024년을 스포츠 관광 활성화의 원년으로 삼았다(이학주, 2024). 스포츠 관광(Sport tourism)이란 신체적 참여를 통한 스포츠 활동을 위해서, 스포츠 이벤트를 관람하기 위해서, 혹은 스포츠와 관련된 매력물을 돌아보기 위해서 일시적으로 거주지를 떠나는 여가 활동 중심의 여행을 의미한다(Gibson, 1998). 스포츠 관광은 국제적으로 빠르게 성장하고 있는 특수 관광 중 하나이며 지역 사회, 도시, 국가 경제 등에 기여한다(Alexandris & Kaplanidou, 2014). 스포츠 관광 시장의 규모는 2023년에 5,467억 달러로 평가되는 등 계속해서 성장하고 있으며, 그 중 “스포츠 이벤트”의 중요성이 높아지고 있다(Global Market Insight, 2024).
이벤트 스포츠 관광(Event sport tourism)이란 스포츠 이벤트 참여를 목적으로 하는 관광 활동을 의미한다(Gibson, 1998). 스포츠 이벤트는 단순히 운동선수들의 경기뿐만 아니라 하나의 지역 축제로 승화되어 문화적 교류, 지역 이미지 제고 등이 가능하다는 이점이 있다(박재환, 2011). 또한, 스포츠 이벤트 개최는 관광객 유치와 그들에게서 파생되는 소비를 통해 국가 및 지역 경제 활성화를 촉진하는 등의 긍정적인 유, 무형적 효과를 가지기에(Kim et al., 2022; 김대환, 김하니, 2019), 전 세계적으로 국가 및 도시들은 스포츠 이벤트를 개최하기 위하여 노력한다(O’Brien & Chalip, 2007). 대한민국은 동⋅하계 올림픽, 월드컵, 아시안게임, 세계육상선수권대회 등 다양한 스포츠 이벤트 개최지로 선정되었으며, 스포츠 이벤트를 성공적으로 개최한 스포츠 선진국의 이미지를 공고히 다지고 있다(김대환, 김방출, 2019; 김지훈, 김로빈, 2024).
이러한 중요성으로 인해, 이벤트 스포츠 관광과 관광객에 관한 연구는 스포츠 경영학, 경제학 등의 분야에서 다수 연구되었다. 구체적으로 권웅, 성윤태, 맹이섭(2016)은 투르 드 코리아 기간 동안 관람객의 소비를 바탕으로 지역 경제 파급효과를 분석하여 스포츠 이벤트 개최가 개최 지역의 생산, 부가가치, 고용 증대에 긍정적으로 기여한다고 밝혔다. 또한 민두식, 고정민, 이완영(2020)은 국제스포츠 이벤트 관람객의 체험과 지각된 가치, 관광 지역 이미지, 만족도, 행동 의도 간의 구조적 관계를 규명하여 스포츠 이벤트를 통한 지역 이미지 제고, 지역 관광 활성화 등의 긍정적인 효과를 제시하였다.
그 밖에도, 다양한 선행연구에서 이벤트 스포츠 관광의 중요성과 그로 인한 긍정적인 효과를 검증하여 학문적, 실무적 의의를 제시하였다. 그러나, 관련 선행연구에서는 스포츠 이벤트에 대한 인식을 개인의 주관적인 심리에 초점을 맞춰 이해하는 등 미시적인 관점에서 효과성을 검증했다는 한계점을 지니고 있다. 스포츠 이벤트의 규모 특성상, 개개인의 관점을 통해 스포츠 이벤트를 이해하려는 미시적 접근보다 사회적 차원에서 전반적인 스포츠 이벤트를 이해할 수 있는 거시적 접근이 적절할 수 있다. 따라서, 본 연구는 거시적인 관점에서 빅데이터를 활용하여 특정 스포츠 이벤트에 대한 관광객의 인식과 실질적인 경험을 바탕으로 관광객들이 해당 스포츠 이벤트와 함께 어떠한 요인들에 관심을 가지고, 스포츠 이벤트에 대해 어떠한 담론을 형성하는지 파악하고자 한다.
빅데이터 분석이란(Big data analysis) 일반적인 데이터베이스의 용량을 초과하는 대용량의 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다(류시영, 유선욱, 2017). 과거에 비해 현대 사회의 데이터는 빠른 속도로 생성되며, 다양한 형태로 형성되는 등의 특징을 가지고 있어 빅데이터를 활용한 분석 기술이 다양해지고 있다(이정학, 이재문, 김재환, 김형근, 2017). 특히 빅데이터 분석은 특정한 집단이 아닌 사회 전체의 다양한 인식과 현황을 파악하는데 적절하며(최현주, 최연철, 2016), 미시적 관점에서 불가능했던 새로운 정보와 가치를 도출할 수 있다는 장점이 있다(장지명, 황성화, 2021). 이에 따라 사회, 경제, 정치, 과학 등 다양한 영역에서 활발하게 빅데이터 분석이 진행되고 있으며, 체육학 분야에서도 빅데이터 분석 기술을 적용하여 새로운 지식을 도출하려는 시도가 증대되고 있는 추세이다(이희지, 김지훈, 이준성, 2022).
특히, 스포츠 관광의 활성화 방안을 도출하기 위하여 빅데이터를 활용한 대중들의 인식과 트렌드 등을 분석한 연구가 다수 수행되고 있다. 구체적으로, 김종성(2017)은 빅데이터를 활용하여 “스포츠 관광”, “레저스포츠”, “스키”, “자전거” 등과 관련된 연관어를 탐색하였으며, 연구 결과를 통해 빅데이터 분석과 관련 선행연구의 결과가 유사하다는 점을 확인하여 빅데이터 분석을 신뢰성을 제시하였다. 김민수, 오승욱, 한진욱(2019)의 연구에서는 소셜 미디어 빅데이터를 활용하여 레저스포츠관광의 트렌드를 분석하였다. 연구 결과, 레저스포츠관광의 버즈량은 블로그에서 가장 높게 나타났으며 가장 많이 언급되었던 종목은 자전거, 낚시, 캠핑 순서로 나타났다. 마지막으로 최주현, 엄진종(2024)의 연구에서는 빅데이터를 활용하여 텍스트 마이닝 및 CONCOR 분석을 기반으로 충청남도의 스포츠 관광 트렌드와 중심성 및 군집을 도출하였다. 이를 통해 기간 별 주요 키워드를 도출하였으며, e스포츠 대회 등 스포츠 대회가 관광 산업의 발전 전략이 될 수 있음을 제시하였다.
이렇듯 다양한 선행연구에서 스포츠 관광에 대한 빅데이터 분석을 수행하고 있지만, 대부분의 연구들은 신체적 참여를 통한 스포츠 관광에만 초점이 맞춰져 있다는 한계점을 지니고 있다. 몇몇 선행연구에서는 스포츠 이벤트에 대한 빅데이터 분석을 수행하여 긍정적인 측면을 제시하고 있으나(김민수, 2023; 장지명, 황성화, 2021), ‘이벤트 스포츠 관광’에 대한 실질적인 빅데이터 분석은 미비한 실정이다. 스포츠 관광 분야에서 이벤트 스포츠 관광의 중요성이 부각되고 있는 현 상황에서, 이벤트 스포츠 관광에 대한 빅데이터 분석은 관광 및 스포츠 산업에 중요한 시사점을 제공할 수 있을 것으로 판단된다. 특히, 개인 단위로 진행되는 참여 스포츠 관광보다 대규모의 이벤트 스포츠 관광에 대하여 빅데이터 분석을 수행하는 것은 대중들의 전반적인 인식을 이해하는 데 도움이 될 수 있다.
따라서, 본 연구의 목적은 소셜 빅데이터를 활용하여 이벤트 스포츠 관광객의 실제 경험을 분석하는 것이다. 구체적인 목표는 다음과 같다: (1) 이벤트 스포츠 관광과 함께 나타나는 핵심 단어들을 도출하고, 핵심 단어 간의 연결 관계 및 구조를 분석한다. (2) 이벤트 스포츠 관광 경험 이후 스포츠 이벤트와 관련하여 어떠한 담론들이 형성되는지 탐색한다. (3) 스포츠 이벤트에 대한 이벤트 스포츠 관광객의 감정을 분석한다. 이를 통해 이벤트 스포츠 및 스포츠 관광 관련 실무자에게 실용적 시사점을 제시하여 이벤트 스포츠 관광 활성화에 기여할 수 있을 것으로 기대된다.
연구방법
1.
연구 대상 및 조사 도구
본 연구는 최근 한국에서 개최된 MLB 월드투어 서울시리즈를 대상으로 빅데이터 분석을 실시하였다. 자료 수집과 분석을 위하여 텍스톰(Textom)과 오픈 소스 통계 프로그램 R을 활용하였다. 텍스톰은 KrKwic(Korean KeyWords in Context) 프로그램을 기반으로 한 빅데이터 처리 솔루션으로 다양한 자료들을 검색하여 데이터 추출, 정제, 매트릭스 생산 등의 일괄 처리가 가능하기에 네트워크 분석 시 유용한 소프트웨어로 활용되고 있다(이희지 등, 2022). 본 연구에서는 텍스톰을 활용하여 네이버(Naver)와 다음(Daum)을 수집 채널로 선정하였으며, 이벤트 스포츠 관광 이후 관광객의 경험에 대한 데이터를 수집하기 위하여 블로그와 카페로 수집 범위를 지정하였다. 자료 수집을 위한 검색어는 스포츠 이벤트의 전반적인 인식을 분석하고 해당 스포츠 이벤트를 직접 관람한 소셜 빅데이터를 수집하기 위하여 “서울시리즈”, “서울시리즈 + 관람”, “서울시리즈 + 직관”으로 선정하였다. 자료 수집 기간은 실제 이벤트 첫 개최 날짜인 2024년 3월 17일부터 스포츠 이벤트에 대한 빅데이터 분석에 있어 불필요한 내용이 포함되지 않도록 연구자가 관람 후기 글을 직접 확인한 후 4월 17일까지로 지정하였다. 자료 분석은 단어 빈도 분석, TF-IDF, 의미 연결망 분석, LDA(Latent Dirichlet Allocation) 토픽 모델링, 감성 분석을 실시하였다.
2.
분석 방법
본 연구의 목적을 달성하기 위하여 텍스트 마이닝(text mining)을 통한 빅데이터 분석을 수행하였다. 텍스트 마이닝이란 자연어 처리 기술을 바탕으로 비정형 데이터(Unstructured data)로부터 패턴 및 관계 등 새로운 정보를 추출하는 기술이다(Hotho, Nürnberger & Paaß, 2005). 텍스트 마이닝은 다양한 분야에서 실무적, 학술적으로 빈번히 활용되어 빅데이터 분석 방법 중에서 가장 핵심적인 기술로 여겨지고 있다(이희지 등, 2022; 장재영, 2013). 본 연구에서 진행된 텍스트 마이닝 절차는 다음과 같다.
1)
데이터 전처리(Data Pre-processing)
우선, 분석을 위해 텍스톰을 활용하여 텍스트 데이터 전처리 과정을 거쳤다. 데이터 전처리란 데이터에 포함된 불필요한 요소들(Noise)을 수정 및 제거하는 과정을 의미한다(이준혁 등, 2019). 이러한 과정을 통해 불용어(Stop words), 특수 기호, 문장 부호, 공백 등을 제거함으로써 빅데이터 분석에 사용되는 데이터의 품질을 향상시킬 수 있다(빈삼, 염혜정, 심수인, 2021). 본 연구에서는 수집된 데이터에서 분석에 불필요한 단어들을 삭제하고(예: 것 등)이벤트 스포츠 관광과 관련이 없는 단어들을 제거하였다(예: 미술관, 등). 구체적인 데이터 정제의 예는 <표 1>과 같다.
2)
단어 빈도 분석(Word Frequency Analysis)
단어 빈도 분석이란 해당 단어의 중요성을 나타내는 척도 중 하나로, 문서 내에서 단어가 얼마나 빈번하게 등장하는 지를 나타낸다(Julia & David, 2019). 본 연구에서는 단어 빈도 분석을 통해 출현 빈도가 가장 높은 단어 50개를 추출하였다. 다음으로, 단어들의 빈도를 직관적으로 시각화하기 위한 워드 클라우드(Word cloud) 분석을 수행하였다(빈삼 등, 2021). 워드 클라우드 분석이란 단어의 출현 빈도에 따라 서로 크기가 다르게 구름 형태로 표현하는 시각화 기법으로, 단어의 출현 빈도를 한 눈에 알 수 있도록 하는 방식이다(Youn & Lee, 2018). 워드 클라우드의 경우 출현 빈도가 높은 100개의 단어를 활용하여 시각화하였다. 본 연구에서는 이러한 분석 방법을 통해 이벤트 스포츠 관광과 함께 나타나는 단어들을 도출하였다.
3)
TF-IDF 분석(Term Frequency-Inverse Document Frequency)
단어의 출현 빈도가 높다고 해서 그 단어의 중요성이 높다고 판단하기에는 한계가 있다(이지혜, 이정학, 이재문, 2018). 따라서, 문서 상에서 공통적으로 나타나는 빈도를 함께 고려하여 특정 단어가 해당 문서의 특징을 얼마나 잘 반영하고 있는지에 따라 가중치를 부여하는 방법인 TF-IDF 분석을 실시하였다(Jing, Huang, & Shi, 2002). 우선 TF란 단어의 빈도(Term Frequnecy)로, 문서의 특정 주제와 관련된 단어 및 단어 조합이 등장하는 빈도를 의미한다. 그러나 이러한 빈도가 모든 문서에서 흔히 등장하는 경우, 단어의 가중치를 낮게 부여할 수 있는데 이를 IDF(Inverse Document Frequency)라 한다(이희지 등, 2022). 이러한 두 값을 곱하여 TF-IDF 값을 산출하며, 단순 횟수를 의미하는 TF 값보다 특정 단어가 얼마만큼 유의미한지를 나타낼 수 있기에 TF-IDF 값은 의미 있는 정보로 활용되고 있다(오산, 2023). 따라서, 본 연구에서는 TF-IDF 분석을 통해 이벤트 스포츠 관광과 관련성이 높은 핵심 단어들을 도출하였다.
4)
의미 연결망 분석(Semantic Network Analysis)
의미 연결망 분석이란 핵심 단어들 사이의 관계를 계량적으로 제시하여 연결망 구조로 표현하는 분석 방법으로, 두 개 이상의 키워드가 일정한 범위에서 동시 출현(Co-occurrence)하는 빈도를 계수화하는 것을 의미한다(정호윤, 2023). 구체적으로, 각각의 핵심 단어를 노드(Node)의 개념으로 놓고 단어 간의 연결 상태를 엣지(Edge)로 표현하며 이러한 링크가 얼마나 밀접한지를 나타내는 연결 중심성(Degree centrality)을 통해 의미를 해석할 수 있다(Wang & Rada, 1998). 의미 연결망 분석은 특정 주제에서 나타난 단어들의 구조를 파악하고 의미 체계와 패턴 등을 분석할 수 있어 사회과학 분야에서 유용한 방법으로 활용되고 있다(이희지 등, 2022). 따라서, 본 연구에서는 이벤트 스포츠 관광의 핵심 단어 간의 연결 관계 및 구조를 분석하기 위하여 의미 연결망 분석을 실시하였다.
5)
LDA 토픽 모델링(LDA Topic Modeling)
토픽 모델링이란 비구조화된 문서에서 잠재된 주제들을 찾기 위해 개발된 통계 추론 방법으로, 각 문서를 주제의 확률적 혼합체로 가정하고 각 주제를 단어의 분포로 표현함으로써 문서의 구조를 예측할 수 있는 분석 모델이다(박자현, 송민, 2013). 본 연구에서는 토픽 모델링 분석 기법 중에서 잠재 디리클레 할당(Latent Dirichlet Allocation; LDA)을 채택하였다.
LDA는 토픽 모델링의 가장 대표적인 기법으로, 단어들의 확률을 통해 문서 집합 내에서 잠재된 주제들을 찾아내는 기법이다(김태경, 최회련, 이홍철, 2016). LDA는 문서, 단어 등 관찰된 변수들을 통해 문서의 구조 등 보이지 않는 변수를 추론하는 방법으로 각 단어가 주제에 포함될 확률, 문서 내에서의 주제 비율, 전체 문서 집합의 주제 등을 분석할 수 있다(박자현, 송민, 2013). 본 연구에서는 이벤트 스포츠 관광 경험 이후 스포츠 이벤트와 관련하여 어떠한 주제들과 단어들이 형성되는지 파악하기 위하여 LDA 토픽 모델링을 실시하였다.
6)
감성 분석(Opinion Mining)
감성 분석이란 문서 내 단어들의 표현 등을 통해 해당 주제에 대한 작성자의 감성 종류(긍정, 부정 등)나 감정의 강도를 분석하는 기법이다(Wang, Zhang, & Zhai, 2011). 또한 단순히 긍정 및 부정과 같이 상반되는 극성의 분류부터 기쁨, 슬픔, 흥분, 놀람 등 다양한 감정을 범주화할 수 있으며(서상현, 김준태, 2016), 해당 감정과 관련된 단어들을 추출하여 작성자의 의도나 태도를 분석할 수 있다(윤호민, 최규완, 2021). 따라서, 감성 분석은 다양한 산업 및 학술 분야에서 활용되고 있다. 본 연구에서는 스포츠 이벤트 이후 이벤트 스포츠 관광객의 구체적인 감정을 분석하기 위하여 감성 분석을 실시하였다.
3.
신뢰도 및 타당도
빅데이터 분석과 해석 과정은 분석가의 주관적인 통찰을 바탕으로 진행되기 때문에 분석가 주관의 개입 가능성이 높다(김예란, 2013). 따라서 본 연구에서는 신뢰도 및 타당도를 확보하기 위하여 데이터 수집 방법, 수집 채널 및 단위, 수집 검색어, 분석 결과 해석 등 모든 연구 과정에 있어 전문가 집단(스포츠 경영학 전공 교수 1인과 박사과정 2인) 회의를 거쳐 진행되었다.
구체적으로, 다음의 3가지 절차(이정학, 이제문, 김후년, 2019)로 진행되었다. 첫째, 본 연구의 빅데이터 분석에서 사용될 핵심 단어들의 의미를 정확하게 파악하기 위하여 핵심 단어와 연결 단어들을 확인하였다. 둘째, 본 연구에서 사용될 수집 검색어가 타당한지 확인하기 위하여 실제 수집 채널(네이버, 다음)에서 직접 검색을 실시하여 해당 검색어의 의미를 파악하였다. 셋째, 수집된 빅데이터를 정제하는 과정에 있어 주관성을 배제하고 신뢰도를 확보하고자 전문가 3인의 지속적인 논의를 통해 진행되었다.
결과
1.
데이터 수집 결과
본 연구의 목적을 달성하기 위하여 2024년 3월 17일부터 4월 17일까지의 빅데이터를 수집하였다. 수집 키워드, 수집 채널에 따른 결과는 <표 2>와 같다.
표 2.
데이터 수집 결과
2.
단어 빈도, TF-IDF 분석 결과
먼저, 본 연구에서 이벤트 스포츠 관광에 대한 단어들의 빈도를 파악하여 상위 50개 단어를 추출하였으며, 워드 클라우드를 통해 시각화하였다<그림 1>. 또한 단순 빈도분석의 한계를 보완하고자 TF-IDF 분석을 함께 실시하였다. 분석 결과는 <표 3>과 같다.
표 3.
단어 빈도 및 TF-IDF 결과
단어 빈도분석 결과, 서울시리즈(5929), 경기(3296), 서울(3101), 다저스(2775), 시리즈(2274), 고척(2016), 오타니(1604), 관람(1561), 직관(1543), 야구(1498), 개막전(1387), 월드투어(1333), 샌디에이고(1296), 파드리스(1253), 메이저리그(1252) 등의 순으로 나타났다. 다음으로 TF-IDF 분석 결과 경기(3337.545), 다저스(3271.033), 오타니(2876.129), 고척(2801.329), 서울(2490.493), 야구(2421.856), 직관(2416.428), 개막전(2408.102), 서울시리즈(2386.467), 샌디에이고(2378.56), 월드투어(2314.348), 메이저리그(2303.818), 시리즈(2299.077), 파드리스(2226.772) 등의 순으로 나타났다. ‘경기’, ‘다저스’, ‘오타니’ 등의 경우 출현 빈도에 비해 TF-IDF 지수가 높게 나타났으며, ‘서울시리즈’, ‘서울’, ‘시리즈’ 등의 경우 출현 빈도에 비해 TF-IDF 지수가 낮게 나타났다.
3.
의미 연결망 분석 결과
먼저, 의미 연결망 분석 전 이벤트 스포츠 관광에 대한 네트워크의 구조적 속성을 살펴보았다. 단어의 동시 출현 빈도가 200회 이상인 단어들만 추출한 결과, 네트워크의 규모를 측정하는 노드는 47개, 노드의 총 연결 관계의 수를 의미하는 엣지는 402개로 나타났다. 다음으로 의미 연결망 분석 결과, 서울시리즈(.88)가 가장 높은 연결 중심성 값을 가지는 것으로 나타났으며, 경기(.64), 다저스(.54), 서울(.52), 고척(.40), 야구(.34) 등의 순으로 연결 중심성이 높은 것으로 나타났다. 전반적인 의미 연결망 분석 결과는 <그림 2>와 같다.
4.
LDA 토픽 모델링 결과
본 연구에서는 LDA 기법을 적용하여 토픽 모델링 분석을 실시하였으며(α = .10, β = .01), 확률 분포(Probability distribution) 값을 기준으로 대표 주제를 선정하였다(김남규, 장승현, 이근모, 2022). 우선, 최적의 토픽 개수를 판단하기 위하여 복잡도(Perplexity)와 응집도(Coherence)를 계산하였다. 그 결과, 이벤트 스포츠 관광과 관련된 토픽의 수는 4개가 적절한 것으로 판단하여 분석을 진행하였다. 구체적인 토픽 명과 토픽 핵심어는 <표 4>에 제시하였다.
표 4.
토픽 모델링 결과
첫 번째 토픽에서는 ‘경기’, ‘다저스’, ‘오타니’, ‘관람’, ‘직관’, ‘후기’, ‘스카이돔’, ‘야구’ 등의 핵심어가 나타났다. 이 핵심어들은 이벤트 스포츠 관광 요소 중 스포츠 이벤트 관람 요소와 관련된 핵심어로서, 관련된 정보나 인기가 많은 구단 및 선수를 중심으로 토픽이 도출되었다. 따라서, 첫 번째 토픽은 ‘관람 정보 속성’으로 명명하였다.
두 번째 토픽에서는 ‘서울’, ‘시간’, ‘한국’, ‘예술’, ‘도시’, ‘문화’, ‘여행’, ‘장소’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면 스포츠 이벤트가 개최되는 국가 및 지역과 관련된 단어들을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 두 번째 토픽은 ‘개최 지역 속성’으로 명명하였다.
세 번째 토픽에서는 ‘판매’, ‘정보’, ‘가격’, ‘등급’, ‘할인’, ‘상품’, ‘거래’, ‘구매’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면, 유니폼 등과 같이 해당 구단이나 선수의 라이센싱(licensing) 상품과 관련된 단어들을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 세 번째 토픽은 ‘라이센싱 상품 속성’으로 명명하였다.
마지막으로, 네 번째 토픽에서는 ‘샌디에이고’, ‘파드리스’, ‘메이저리그’, ‘손예진’, ‘공연’, ‘중계’, ‘송중기’, ‘부부’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면 스포츠 이벤트에서 이슈가 되는 속성들(예: 연예인의 직관이나 공연 등)을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 네 번째 토픽은 ‘관련 이슈 속성’으로 명명하였다.
5.
감성 분석 결과
이벤트 스포츠 관광에 대한 감성 분석 결과, 긍정 비율 75.29%, 부정 비율 24.71%로 긍정 비율이 부정 비율보다 약 3배 이상 높게 나타났다. 긍정 단어로는 추천(360), 기대하다(224), 원하다(211), 새롭다(199), 멋지다(194) 등의 순서로 나타났으며, 부정 단어로는 아쉽다(154), 울다(87), 힘들다(84), 어렵다(71) 등의 순서로 나타났다. 세부 감성 결과로는 호감(Good feeling)이 36.57%로 가장 높게 나타났으며, 흥미(Interest) 23.64%, 기쁨(Joy) 15.08%, 슬픔(Sadness) 9.16%, 거부감(Disgust) 8.02% 등의 순으로 나타났다. 구체적인 감성 분석의 결과는 <표 5>와 같다.
표 5.
감성 분석 결과
논의
본 연구는 소셜 빅데이터를 활용하여 이벤트 스포츠 관광에 대한 관광객의 경험을 탐색함으로써 향후 이벤트 스포츠 관광 활성화에 유용한 자료를 제시하고자 하였다. 이를 위해 최근 한국에서 개최된 MLB 월드투어 서울시리즈 후기 글을 대상으로 텍스톰과 R을 활용하여 연구를 진행하였다. 구체적인 논의는 다음과 같다.
1.
단어 빈도, TF-IDF, 의미 연결망 분석 결과
먼저, 이벤트 스포츠 관광에 대한 단어 빈도 분석 결과 ‘서울시리즈’, ‘경기’, ‘서울’, ‘다저스’, ‘시리즈’, ‘고척’ 등의 키워드가 상위에 노출되었다. 소셜 빅데이터상에서 노출된 단어의 빈도가 높다는 것은 대중들의 관심 정도가 높다고 해석할 수 있다(McKinsey, 2011). 따라서, 이벤트 스포츠 관광객은 해당 스포츠 이벤트, 스포츠 이벤트에서 진행되는 경기, 스포츠 이벤트 관련 구단, 스포츠 이벤트 개최지 순으로 관심도가 높다는 것으로 판단할 수 있다.
다음으로, 이벤트 스포츠 관광에 대한 TF-IDF 분석을 실시한 결과 ‘경기’, ‘다저스’, ‘오타니’, ‘고척’, ‘서울’, ‘야구’, ‘직관’ 등의 순서로 TF-IDF 값이 높은 것으로 나타났다. TD-IDF 값이 클수록 해당 키워드가 포함된 문서에서 중요하다고 해석할 수 있다(김선희, 김범, 서일한, 2022). 특히, ‘경기’, ‘다저스’, ‘오타니’, ‘메이저리그’, ‘선수’의 경우 단어의 출현 빈도 순위보다 TF-IDF 값 순위가 더 높게 나타났다. 이는 이벤트 스포츠 관광객은 스포츠 이벤트에서 개최되는 경기, 인기 스포츠 구단 및 선수 등에 실질적으로 관심도가 높으며 이러한 요소들을 더욱 중요하다고 생각하는 것으로 해석할 수 있다.
마지막으로 의미 연결망 분석 결과 ‘서울시리즈’, ‘경기’, ‘다저스’, ‘서울’, ‘고척’, ‘야구’ 등의 순서로 연결 중심성 값이 높은 것으로 나타났다. 이는 앞서 수행한 단어 빈도 분석, TF-IDF 분석과 대체로 유사한 결과가 도출된 것으로 판단된다. 따라서, 이벤트 스포츠 관광과 함께 나타나는 핵심 단어는 해당 스포츠 이벤트 명, 스포츠 이벤트에서 진행되는 경기, 인기 스포츠 구단 및 선수, 스포츠 이벤트 개최지 등이며 이러한 핵심 단어들을 바탕으로 단어들의 연결 구조가 형성되는 것으로 판단된다. 이러한 핵심 단어 중에서도 경기, 구단, 선수에 대한 중요도가 높은 것으로 나타났는데, 이는 MLB 월드투어 서울시리즈에서 진행되는 경기 종목인 ‘야구’와, 다저스와 오타니처럼 한국에서 화제성이 높은 대상에 대한 관심도와 중요도가 높게 나타난 것으로 판단된다.
‘서울시리즈’, 경기’, ‘야구’ 등에 대한 단어의 빈도 및 TF-IDF가 높게 도출된 결과의 경우 메가 스포츠 이벤트의 경기 내용에 대한 관광객의 중요도와 만족도가 높게 나타난다는 것을 검증하여 스포츠 이벤트에서 경기 자체에 대한 자원을 더 많이 투입해야 할 것을 제시한 최종률, 안덕수, 송기문(2019)의 연구와 맥을 나란히 한다. 또한, ‘다저스’, ‘오타니’ 등에 대한 단어의 빈도 및 TF-IDF가 높게 도출된 결과의 경우 스포츠(축구) 이벤트의 스타 선수가 관계의 질에 긍정적인 영향을 미친다는 것을 검증하여 스타 선수를 통해 잠재적인 소비자들의 관심을 불러일으켜 경기장으로 유인할 수 있음을 제시한 남재준(2020)의 연구와 일맥상통하는 내용을 제시하고 있다.
2.
LDA 토픽 모델링 분석 결과
이벤트 스포츠 관광객의 경험에 대한 LDA 토픽 모델링 분석 결과, 총 4개의 토픽이 도출되었다. 구체적으로 첫 번째 토픽은 ‘경기’, ‘고척’, ‘관람’, ‘직관’, ‘후기’, ‘야구’, ‘선수’, ‘티켓’, ‘입장’, ‘예매’ 등의 키워드로 구성된 ‘관람 정보 속성’이 도출되었다. 이는 이벤트 스포츠 관광객들은 관광 경험 이후 스포츠 이벤트 경기와 관련된 정보(예. 야구, 티켓, 입장 등)들을 바탕으로 담론을 형성한다는 것으로 해석할 수 있다. 특히, 온라인에서는 공간상의 제약이 없기에 다양한 정보를 제공 및 공유하고 있으며 이벤트 스포츠 관광객의 경우 선택에 앞서 스포츠 이벤트에 대한 정보를 획득하고 관광 여부를 결정한다(구강본, 석강훈, 2010). 이러한 정보 탐색 및 제공의 관계는 주체적으로 변경될 수 있으며, 본 연구의 맥락에서 이벤트 스포츠 관광의 선험자가 이후 참여자에게 스포츠 이벤트와 관련된 정보를 제공하는 역할을 하는 것으로 판단된다. 또한, 스포츠 이벤트(행사)와 직접적으로 관련된 정보들은 만족도, 재구매(관람) 행동 등에 큰 영향을 미친다는 것을 검증한 선행연구를 바탕으로(고호석, 2009; 조우정, 2011) 소비자 행동 형성에 있어 중요한 요인임을 시사한다.
두 번째 토픽은 ‘서울’, ‘시간’, ‘한국’, ‘후기’, ‘예술’, ‘도시’, ‘추천’, ‘문화’, ‘여행’ 등의 키워드로 구성된 ‘개최 지역 속성’이 도출되었다. 스포츠 이벤트 개최는 긍정적인 유, 무형적 효과를 불러 일으키며(Kim et al., 2020; Han et al., 2022; Kim et al. 2019; 김대환, 김방출, 2019; 김대환, 김하니, 2019), 개최 국가 및 지역에도 긍정적인 영향을 가져다줄 수 있다. 스포츠 이벤트 개최가 개최지 이미지에 긍정적인 영향을 미친다는 것은 다양한 선행연구를 통해 검증되어 왔다(김영수, 김성환, 김윤숙, 2023; 민두식 등, 2020). 장태순(2008)은 스포츠 이벤트가 영구적인 수준의 지역 관심도를 유발하여 지역 전통과 가치를 강화할 수 있음을 제시하였다. 따라서, 본 연구의 결과를 통해 실질적으로 이벤트 스포츠 관광객이 관광 경험 이후 개최 지역에 대한 담론을 형성한다는 것을 검증하였다고 판단된다.
세 번째 토픽은 ‘판매’, ‘정보’, ‘가격’, ‘등급’, ‘할인’, ‘상품’, ‘거래’, ‘구매’, ‘팝업’, ‘유니폼’ 등의 키워드로 구성된 ‘라이센싱 상품 속성’이 도출되었다. 특히 MLB는 패션 기업이 스포츠라는 매개체를 통해 기업 이미지 개선, 스포츠 용품 소비 등 긍정적인 효과를 얻는 브랜드 라이센싱의 대표적인 사례이다(심우택, 신선윤, 2017). MLB 월드투어 서울시리즈의 경우, 스포츠 이벤트 현장에서 MLB 굿즈샵 슈퍼스토어를 운영하여 일 매출 9억원을 달성하였다(조정희, 2024). 또한, 뉴발란스는 서울시리즈를 기념하는 팝업스토어를 마련하여 다양한 상품과 콘텐츠를 구성하였으며 MLB 코리아는 서울시리즈를 기념하는 한정판 모자를 출시하여 사전 주문 전량 매진을 기록했다. 이러한 유통업계의 마케팅 전략을 통해 이벤트 스포츠 관광객의 주목을 이끌어 머천다이징 및 라이센싱 상품에 대한 담론이 형성된 것으로 판단된다. 전호문(2005)은 스포츠 이벤트 관광객의 소비지출을 분석하여 패턴 및 경제적 파급효과를 제시하였다. 분석 결과, 지출 패턴 중 숙박 다음으로 쇼핑에 대한 소비 자출이 높은 것으로 나타났다. 이러한 결과를 통해 스포츠 이벤트 관광객은 관련된 상품에 대한 담론을 형성할 뿐만 아니라 실질적인 소비까지 이어질 수 있다는 것을 시사한다.
네 번째 토픽은 ‘샌디에이고’, ‘파드리스’, ‘개막전’, ‘서울시리즈’, ‘월드투어’, ‘메이저리그’, ‘손예진’, ‘공연’, ‘현빈’, ‘송중기’ 등의 키워드로 구성된 ‘관련 이슈 속성’이 도출되었다. 이는 이벤트 스포츠 관광객이 관광 경험 이후 해당 스포츠 이벤트와 관련 이슈들을 바탕으로 담론을 형성한다는 것으로 해석할 수 있다. 스포츠 이벤트가 자신의 국가에서 개최되는 것만으로도 큰 이슈가 될 수 있지만, 선호하는 구단(예: 샌디에이고 파드리스)이나 다양한 이벤트(예: 공연), 그리고 대중들의 관심을 이끄는 요소들(예: 손예진 현빈 부부의 직관) 등 다양한 이슈가 함께 나타날 수 있다. 이러한 결과는, 스포츠 이벤트 관광객은 다양한 요인 중 스포츠 이벤트의 특이성과 독특함과 같은 요인들을 중요하게 생각한다는 것을 검증한 김민철, 이율(2010)의 연구와 일맥상통한다.
3.
감성 분석 결과
이벤트 스포츠 관광에 대한 관광객의 감정을 살펴보기 위하여 감성 분석을 실시한 결과 긍정 비율 75.29%, 부정 비율 24.71%로 나타났다. 긍정 단어는 주로 ‘추천’, ‘기대하다’, ‘원하다’, ‘새롭다’, ‘멋지다’, ‘특별하다’ 등으로 이벤트 스포츠 관광에 대한 긍정적인 표현이 매우 높게 나타났다. 이러한 결과는 이벤트 스포츠 관광객은 해당 스포츠 이벤트를 경험하기 전 기대감을 가지고 있으며, 실제 새롭고 특별한 경험을 통해 스포츠 이벤트를 추천하는 긍정적 의사결정 과정의 결과에서 나타난 결과일 것으로 판단된다.
반면 부정 단어는 ‘아쉽다’, ‘울다’, ‘힘들다’, ‘어렵다’ 등으로 나타났는데, 이는 이벤트 스포츠 관광 경험의 과정에서 개인의 기대감을 충족시키지 못했거나, 불편을 느껴 발생한 감정이라 판단된다. 따라서, 스포츠 이벤트를 통한 긍정적인 효과를 창출하기 위해서는 개최 이전 정확하고 구체적인 분석을 통해 관광객들의 활력 부여를 저해하는 요인을 제거해야 할 것을 시사한다(김병식, 김성겸, 2008).
4.
연구 결과의 이론적, 실무적 시사점
본 연구의 결과를 통해 다음과 같은 이론적 시사점을 제시하고자 한다. 먼저, 본 연구는 기존 양적 연구의 미시적 관점에서 벗어나 거시적 관점에서 이벤트 스포츠 관광에 관한 다양한 사례와 다양한 변수들을 도출하고자 하였다. 이러한 과정을 통해 이벤트 스포츠 관광에 대하여 더욱 포괄적인 이해를 제시하고자 하였으며, 본 연구에서 도출한 변수들을 통해 이벤트 스포츠 관광과 관련된 후속 연구에 의미 있는 시사점을 제시하였다.
또한, 이벤트 스포츠 관광을 기획하고 있는 실무자들을 위한 다음과 같은 실무적 시사점을 논의하고자 한다. 첫째, 이벤트 스포츠 관광객은 관광 경험 이후 이벤트에서 진행되는 경기, 인기 스포츠 구단이나 선수, 스포츠 이벤트 개최지 등을 중요하게 생각하는 것으로 나타났다. 따라서 관련 실무자는 다수의 소비자들의 주목을 이끌 수 있는 경기를 매칭하고(예. 스타 플레이어 매치, 은퇴 선수 레전드 매치), 개최 국가의 대중들이 선호하는 선수나 구단을 활용하여 스포츠 이벤트를 개최해야 할 것으로 판단된다.
둘째, 이벤트 스포츠 관광객은 관광 경험 이후 관람 정보 속성, 개최 지역 속성, 라이센싱 상품 속성, 관련 이슈 속성 등을 바탕으로 스포츠 이벤트에 대한 담론을 형성하는 것으로 나타났다. 따라서 스포츠 이벤트에 대한 긍정적인 담론을 형성하기 위해서는 체계적인 예매 시스템, 경기장 입장 통제 등을 통해 관광객이 스포츠 이벤트를 관람하는 데 있어 불편함을 겪지 않도록 해야 할 것으로 판단된다. 또한, 스포츠 이벤트 개최 국가 내에서 위치적으로 접근성이 우수한 곳을 개최 지역으로 선정하거나, 대중교통 운행 증대 등 이동 수단을 충분히 마련함으로써 스포츠 이벤트 개최지에 대한 긍정적인 이미지를 형성해야 할 것으로 판단된다.
셋째, 스포츠 이벤트의 라이센싱 및 머천다이징 상품은 이벤트 스포츠 관광객뿐만 아니라 많은 대중들의 관심을 이끌며, 실질적인 수익 또한 창출하고 있다. 따라서, 관련 실무자는 스포츠 이벤트를 기념할 수 있는 한정판 상품이나 인기 있는 선수들의 상품을 제작하여 온, 오프라인을 통해 판매를 진행해야 할 것으로 판단된다. 마지막으로 관련 이슈 속성과 관련하여, 관련 실무자는 스포츠 이벤트와 함께 대중들의 주목을 이끌고 즐길 수 있는 연예인 초청 공연, 팬 사인회와 같은 선수들과 함께 진행할 수 있는 이벤트를 구성함으로써 스포츠 이벤트에 대한 관심과 만족도를 높여야 할 것으로 판단된다.
한편, 이벤트 스포츠 관광객은 관광 경험 이후 대부분 긍정적인 감정을 지니는 것으로 나타났으나, 약 25%의 부정적인 감정 또한 지니는 것으로 나타났다. 따라서, 관련 실무자는 유사한 이벤트 사례들을 구체적으로 분석하여 관광객이 어떠한 과정에서 불편함을 느꼈는지(예. 경기 시간대의 더운 날씨), 이를 어떤 방식으로 해결할 수 있는지(예. 경기 날짜 및 시간대 조정)에 대한 방안을 고려해야 할 것으로 사료된다.
결론 및 제언
본 연구는 빅데이터 분석을 통해 이벤트 스포츠 관광에 대한 관광객의 경험을 살펴보았으며, 연구 결과에 따른 결론 및 제언은 다음과 같다.
먼저, 빅데이터 분석 결과 이벤트 스포츠 관광객들은 스포츠 이벤트와 관련된 구단, 선수, 개최 지역, 종목에 대하여 자주 언급하며, 해당 키워드를 중심으로 단어들의 구조가 형성되는 것으로 나타났다. 다음으로 스포츠 이벤트와 관련된 토픽의 경우, 이벤트 스포츠 관광객들은 4개의 토픽(스포츠 이벤트 관람, 스포츠 이벤트 개최 지역, 스포츠 이벤트 관련 상품, 스포츠 이벤트 관련 정보)을 중심으로 이벤트 스포츠 관광 경험에 대한 담론을 형성하는 것으로 나타났으며, 이벤트 스포츠 관광객은 해당 스포츠 이벤트에 대하여 높은 긍정적인 감정을 가지고 있는 것으로 나타났다. 이러한 결과를 통해, 본 연구는 거시적 관점에서 이벤트 스포츠 관광에 대한 대중들의 전반적인 인식을 이해하여 스포츠 이벤트와 관련된 기존 연구의 결과를 지지하였으며 이벤트 스포츠 관광과 관련하여 어떠한 토픽들이 형성되는가 파악함으로써 관련 실무자에게 중요한 시사점을 제공하였다.
본 연구는 이벤트 스포츠 관광에 대한 이론적 및 실용적 시사점을 제시하지만, 다음과 같은 연구의 한계점을 지니고 있으며, 이에 대한 논의를 바탕으로 후속 연구를 위한 제언을 하고자 한다. 먼저, 본 연구는 MLB 월드투어 서울시리즈에 대한 관광객의 경험을 바탕으로 빅데이터 분석을 실시하였다. 현재 스포츠 이벤트는 다양하게 개최되고 있으며(예. 올림픽, 아시안 게임 등), 그러한 종류에 따라 이벤트 스포츠 관광객의 인식에도 차이가 있을 수 있다. 따라서, 후속 연구에서는 다양한 스포츠 이벤트를 고려하여 스포츠 이벤트 종류에 따른 관광객의 인식 분석을 수행한다면 보다 폭 넓은 연구 결과를 도출할 수 있을 것으로 판단된다.
마지막으로 본 연구에서는 단어 빈도 분석, TF-IDF 분석, 의미 연결망 분석, LDA 토픽 모델링, 감성 분석을 통해 이벤트 스포츠 관광객의 관광 경험에 대한 포괄적인 이해를 제시하고자 하였다. 그러나, 이러한 분석 기법들은 향후 이벤트 스포츠 관광객의 행동을 예측하기에는 한계점을 지닌다. 따라서, 후속 연구에서는 빅데이터와 인공지능 등을 함께 활용한 예측 분석(Predictive analytics)을 통해 이벤트 스포츠 관광객의 미래 행동을 효율적으로 예측할 수 있는 연구를 수행해야 할 것으로 사료된다.

